FILTER MODE ACTIVE

#механистическая интерпретируемость

Найдено записей: 2

#механистическая интерпретируемость15.11.2025

OpenAI обучает весово разреженные трансформеры для выявления компактных интерпретируемых цепей

'OpenAI использует обучение с жесткой весовой разреженностью, чтобы извлекать небольшие и проверяемые цепи, объясняющие поведение модели на простых Python задачах.'

#механистическая интерпретируемость13.11.2025

Новый прозрачный LLM OpenAI показывает, как «думает» ИИ

'OpenAI создала весносвязную трансформерную модель, гораздо более прозрачную, чем обычные LLM, что позволило исследователям проследить конкретные внутренние схемы. Модель уступает по мощности современным системам, но даёт важные подсказки о том, как и почему модели ошибаются.'